Day 28 針對 CloudWatch Log 篩選資料反向建立指標監控

2023 iThome 鐵人賽

DAY 28

Cloud Native

上完 AWS 線上課程就打算應徵相關工作是否搞錯甚麼系列第 28 篇

15th鐵人賽 cloud native aws aws cloudwatch

mark_mew

2023-10-13 23:41:57

941 瀏覽

分享至

在某些特別的狀況下

我們無法對 CPU、記憶體建立告警

告警的目的在於有重大狀況發生

我們需要及時採取行動處理

當現有指標都無法反應現況的時候

這時候對於 Log 中的特定訊息做監控就會是很有效的方式

從 CloudWatch Log 中的指標篩選條件分頁

就可以進入做設定

在頁面中可能會覺得徬徨

不知道該如何做篩選指標

實際上只要輸入雙引號加上關鍵字就可以達成，e.g："ERROR"

但是這樣的關鍵字篩選意義不大

有可能沒辦法抓到真的造成系統出錯的 Log

我們也可以像是 Google 篩選條件這樣

Filter pattern "ERROR" -AWS -登入

先根據關鍵字篩選 Log

然後再使用減號去除不需要的資訊來篩選

對於建立的指標

我們需要設定名字以及存放的叢集

指標數值和預設數值我們就先設定 1 和 0

因為是使用計數的方式來計算所以也只有 1 和 0

如果各位在 Log 擷取的時候有抓到其他數值也可以設定成其他單位

最後確認沒問題後就可以建立指標

建立完指標後我們就可以看到指標篩選條件出現我們剛剛的設定

在 CloudWatch 的頁面中

靜待一段時間後也可以看到我們建立的命名空間出現在所有指標中

參考資料：

Filter pattern syntax for metric filters, subscription filters, and filter log events

Day 27 將 EC2 的 Log 轉發到 CloudWatch Log

Day 29 搭配 EventBridge 和 Lambda 寄送更直觀的 CloudWatch 告警通知

系列文

上完 AWS 線上課程就打算應徵相關工作是否搞錯甚麼共 30 篇

RSS系列文訂閱系列文

7 人訂閱

完整目錄

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

尚未有邦友留言

立即登入留言

上完 AWS 線上課程就打算應徵相關工作是否搞錯甚麼系列 第 28 篇